1.镜像

镜像是Docker中的概念,每个在平台中提交的任务都由一个或多个容器来执行,容器是由镜像创建的运行实例。可以认为镜像打包了一个linux环境,包含了程序运行所需要的各项依赖。平台上使用的镜像都是存放在私有仓库中的,而不是docker的官方仓库,私有仓库地址为10.11.3.8:5000,如果平台已经的环境能满足你的需求,也可以暂时不用关心这个地址。

2. GPU类型和数量

选择任务运行的GPU类型,目前平台支持的GPU类型有:TeslaV100TitanXpGTX1080TiRTX3090等。 填写方式: 点击下拉框,从中进行选择,CPU和内存则按照内置比例默认给出。当不需要GPU运算时,可选择 只CPU

3. 启动命令

任务启动命令。该命令执行完成后,任务也随之结束。

当有多个命令时,可以使用 ;&&||将多命令连接,关于他们的区别,可以参考:https://www.gnu.org/savannah-checkouts/gnu/bash/manual/bash.html#Lists

====分割线====

以下参数是在使用“多任务配置”时才需要关注的设置。

4. 子任务名称

子任务名称,会反映成为容器内的环境变量。 填写方式: 由数字、字母或下划线组成,不同子任务的名称必须互不相同。如果只有一个任务,设置成默认值即可。

5. 子任务数量

表示该子任务将运行的副本数量。子任务类比于进程,该选项定义了将启动的进程数量 填写方式: 一般设置为1。当启动多个子任务时,可以通过环境变量PAI_TASK_INDEX来区别于不同子任务(功能类似pid之于进程)。

6. 最少成功次数

当一批子任务中有X个值已经运行完成了,那么整个任务终止,不再等待其他子任务。 填写方式: 非必填项。只有在 子任务数>1时才有效。 如果你的 子任务数=1 或者你希望等所有任务都运行完才结束任务,该项可不填。

7. 最少失败次数

当一批子任务中有X个值已经运行失败了,那么整个任务终止,不再等待其他子任务。 填写方式: 非必填项。只有在 子任务数>1时才有效。 如果你的 子任务数=1 或者你希望任意一个任务失败就结束任务,该项可不填。

如果你利用多任务配置启动多个独立无关的任务,那么这个选项你需要关心,因为不排除某个任务会失败,而在默认情况下,会把你其他所有任务也终止,这也许不是你想要的。这种情况下,你应该让X=子任务数

results matching ""

    No results matching ""